12. 练习准备:预测生命长度

用线性回归预测预期寿命

在该实验室中,你将使用关于出生时的平均预期寿命以及全世界男性的平均BMI的数据。 数据来自Gapminder

工作区

Notebook 将在课堂内打开。 但是,如果您想单独打开它,可以从 GitHub仓库 中克隆这些资料。

在这个实验中,导航到主分支,然后打开** Regression.ipynb 。 像往常一样,如果你需要任何提示,请随时打开 RegressionSolutions.ipynb **。

数据文件可以在文件夹中的 "bmi_and_life_expectancy.csv" 标签下找到。 它包括三列,包含以下数据:

  • 国家(Country) - 该个体出生的国家。
  • 预期寿命(Life expectancy ) - 该国人的平均预期寿命。
  • ** BMI ** - 该国男性的平均BMI。

你需要完成以下每个步骤:

** 1. 加载数据**

  • 数据位于名为“bmi_and_life_expectancy.csv”的文件中。
  • 使用熊猫 read_csv 将数据加载到 dataframe 中。
  • 将 dataframe 分配给变量bmi_life_data

** 2. 建立一个线性回归模型**

  • 使用scikit-learn的 线性回归 创建回归模型并将其分配给
    bmi_life_model
  • 将模型拟合到数据中。

3. 预测使用模型

  • 使用BMI 21.07931预测并将其分配给变量 laos_life_exp